Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.01 vteřin. 
Filtrování textů extrahovaných z PDF, OCR nebo webu
Lehnert, Filip ; Plchot, Oldřich (oponent) ; Szőke, Igor (vedoucí práce)
Předmětem této práce je pomocí sadou skriptů zdokonalit převod různých typů dokumentů do čistě textové podoby. Převodem různých nástrojů dochází ke vzniku šumu a ne zcela korektním převodem znaků. Tyto skripty extrahovaný textový soubor vyčistí tak, aby výsledný text byl čitelný, dával smysl a neobsahoval zbytky různě vyskytujících se znaků z převodu grafů, tabulek, vzorců apod. Skript pracuje univerzálně a nevyžaduje vstup vzniklý pouze z nástrojů OCR nebo převodu z formátu PDF či webu.
Filtrování textů extrahovaných z PDF, OCR nebo webu
Lehnert, Filip ; Plchot, Oldřich (oponent) ; Szőke, Igor (vedoucí práce)
Předmětem této práce je pomocí sadou skriptů zdokonalit převod různých typů dokumentů do čistě textové podoby. Převodem různých nástrojů dochází ke vzniku šumu a ne zcela korektním převodem znaků. Tyto skripty extrahovaný textový soubor vyčistí tak, aby výsledný text byl čitelný, dával smysl a neobsahoval zbytky různě vyskytujících se znaků z převodu grafů, tabulek, vzorců apod. Skript pracuje univerzálně a nevyžaduje vstup vzniklý pouze z nástrojů OCR nebo převodu z formátu PDF či webu.
Metodologie a problémy při transformaci dat a určení jejího významu v rámci integrace heterogenních informačních zdrojů
Bartoš, Ivan ; Papík, Richard (vedoucí práce) ; Dvořák, Jan (oponent) ; Bureš, Miroslav (oponent)
Metodologie a problémy při transformaci dat a určení jejich významu v rámci integrace heterogenních informačních zdrojů PhDr. Ivan BARTOŠ Abstrakt Tato práce řeší problematiku transformace dat a s nimi souvisejících informací, která je aktuálním problémem v řadě vědních, ale i komerčních oblastí. Výpovědní hodnota informace, její kvalita a kvalita dat, ze kterých vychází, se v různých systémech liší. Toto se děje nejen z důvodu odlišné typologie určitého zdroje informací, ale často i díky samotnému způsobu chápání či zachycení informace o popisované entitě skutečného světa. Informační systémy, v případě této práce jsou to konkrétně databázové systémy, mohou bezchybně fungovat jako samostatné celky. Problém nastává až v momentě potřeby integrace dvou takových heterogenních systémů a následné migraci informací mezi nimi. Na základě této potřeby lze práci rozdělit do čtyř hlavních částí. V první části je popsán způsob, jakým je možné klasifikovat kvalitu dat ve zdroji určeném k integraci, ze kterých lze informace získávat. Vzhledem k obecně známému problému nedostatečné projektové a systémové dokumentace jsou zde popsány takové metody, které lze využít i za předpokladu minimální spolupráce s tvůrcem či správcem zdrojového systému. Prvním krokem je získání čistě statistických hodnot o jednotlivých popisovaných...

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.